package com.zzyl.common.utils.pdf;

import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.text.PDFTextStripper;

import java.io.IOException;
import java.io.InputStream;

/**
 * PDF读取工具类
 *
 * @Author mr.lcc
 * @Data 2025/5/20 11:33
 */
public class PDFUtil {
    public static String pdfToString(InputStream inputStream) {

        PDDocument document = null;
        try {
            // 1.加载PDF文档
            document = PDDocument.load(inputStream);

            // 2.创建一个PDFTextStripper实例来提取文本
            PDFTextStripper pdfStripper = new PDFTextStripper();

            // 3.从PDF文档中提取文本
            String text = pdfStripper.getText(document);

            // 4.返回提取的文本
            return text;

        } catch (IOException e) {
            e.printStackTrace();
        } finally {
            // 关闭PDF文档
            if (document != null) {
                try {
                    document.close();
                    inputStream.close();
                } catch (IOException e) {
                    e.printStackTrace();
                }
            }
        }
        // 5.如果出现异常，返回null
        return null;
    }
}
